home *** CD-ROM | disk | FTP | other *** search
/ Columbia Kermit / kermit.zip / newsgroups / misc.20000217-20000824 / 000305_news@columbia.edu _Tue May 16 11:07:51 2000.msg < prev    next >
Internet Message Format  |  2020-01-01  |  3KB

  1. Return-Path: <news@columbia.edu>
  2. Received: from watsun.cc.columbia.edu (watsun.cc.columbia.edu [128.59.39.2])
  3.     by monire.cc.columbia.edu (8.9.3/8.9.3) with ESMTP id LAA11950
  4.     for <kermit.misc@cpunix.cc.columbia.edu>; Tue, 16 May 2000 11:07:50 -0400 (EDT)
  5. Received: from newsmaster.cc.columbia.edu (newsmaster.cc.columbia.edu [128.59.59.30])
  6.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id LAA08464
  7.     for <kermit.misc@watsun.cc.columbia.edu>; Tue, 16 May 2000 11:07:49 -0400 (EDT)
  8. Received: (from news@localhost)
  9.     by newsmaster.cc.columbia.edu (8.9.3/8.9.3) id LAA01118
  10.     for kermit.misc@watsun.cc.columbia.edu; Tue, 16 May 2000 11:04:44 -0400 (EDT)
  11. X-Authentication-Warning: newsmaster.cc.columbia.edu: news set sender to <news> using -f
  12. From: fdc@columbia.edu (Frank da Cruz)
  13. Subject: Re: translate produces rubbish
  14. Date: 16 May 2000 11:04:26 -0400
  15. Organization: Columbia University
  16. Message-ID: <8fro1q$7jb@watsun.cc.columbia.edu>
  17. To: kermit.misc@columbia.edu
  18.  
  19. In article <8frfqo$o34$1@newsmaster.cc.columbia.edu>,
  20. Jeffrey Altman <jaltman@watsun.cc.columbia.edu> wrote:
  21. : In article <1T8U4.104$kw4.3981@read2.inet.fi>,
  22. : ralf.strandell <ralf.strandell@silja.com> wrote:
  23. : : I'm using C-Kermit 7.0.196 for Unixware
  24. : : on an Unixware 7.0.1 server.
  25. : : 
  26. : : I'm trying to convert files from ascii to cp850
  27. : : (from unix to dos) but when I give the command:
  28. : : "translate testfile1 ascii cp850 testfile2"
  29. : : then testfile2 contains nothing sane.
  30. : : 
  31. : : Examples: let's convert from ascii to ascii (identical)
  32. :
  33. First off, the command doesn't make sense -- if you translate
  34. a file from ASCII to CP850, the result would be identical, since
  35. ASCII *is* the left half of CP850.  You probably mean to convert
  36. from one 8-bit character set to another, e.g.:
  37.  
  38.   translate testfile1 latin1 cp850 testfile2
  39.  
  40. Be sure to identify the character set of the original file correctly.
  41.  
  42. : : file1 is:
  43. : : 
  44. : :     abc
  45. : :     def
  46. : :     123
  47. : :     ghi
  48. : : 
  49. : : after "translate file1 ascii ascii file2" I get file2:
  50. : : 
  51. : : b
  52. : : e
  53. : : 2
  54. : : h
  55. : : 
  56. : : What happened with the rest of the characters?
  57. : : 
  58. : : If I convert from ascii to cp850 ( or from ascii to latin1 )
  59. : : then all characters in the output file will be question marks.
  60. : : 
  61. : : What's wrong?
  62. : : 
  63. : : I need this conversion utility because not all data transfer
  64. : : applications know how to translate character sets.  (kermit does, but
  65. : : some files must be moved to directories that are mounted over network
  66. : : and the mv command does not convert anything... )
  67. : This is a confirmed bug that occurs on all Little Endian based 
  68. : architectures such as Intel X86 processors.
  69. Funny nobody noticed it in six months of beta testing :-)
  70.  
  71. The problem is new to C-Kermit 7.0 and K95 1.1.20; it happened in the
  72. course of adding the new Unicode features.
  73.  
  74. We'll be putting up a new test version shortly that fixes this and a few
  75. other bugs and that have some new features.
  76.  
  77. In the meantime, you can work around this problem as follows:
  78.  
  79.   set file ucs byte-order big-endian
  80.   translate file1 latin1 ascii file2
  81.   set file ucs byte-order little-endian
  82.  
  83. - Frank